Wpływ Social Media na życia studentów

1 Wprowadzenie

W dobie powszechnej cyfryzacji media społecznościowe stały się nieodłącznym elementem codzienności akademickiej, kształtując sposób, w jaki studenci komunikują się, spędzają wolny czas i budują relacje. Celem niniejszego raportu jest wielowymiarowa analiza wpływu korzystania z platform społecznościowych na dobrostan studentów. Szczególny nacisk położono na zbadanie korelacji między czasem ekranowym a zdrowiem psychicznym, jakością snu oraz wynikami w nauce.

Raport zawiera przegląd kluczowych statystyk, wizualizację rozkładu zmiennych oraz wnioski płynące z analizy zależności między cechami demograficznymi a wzorcami zachowań cyfrowych. Analizowany zbiór danych składa się z 705 obserwacji oraz 13 zmiennych, obejmujących m.in. dane demograficzne, preferowane platformy, czas użytkowania oraz wskaźniki subiektywnego poczucia uzależnienia.

Projekt pomoże odpowiedzieć na postawione przez nas pytania badawcze, takie jak: - Czy istnieje statystycznie istotna zależność między poziomem uzależnienia od social mediów a zdrowiem psychicznym studentów, - Jak korzystanie z mediów społecznościowych wpływa na wyniki akademickie? -

1.1 Opis danych

Analizowany zbiór danych składa się z 13 zmiennych dotyczących studentów z różnych krajów. Dane obejmują trzy kluczowe obszary:

Demografię (m.in. wiek, płeć, poziom edukacji).

Aktywność w sieci (średni czas korzystania, najczęściej używana platforma).

Wskaźniki dobrostanu (poziom uzależnienia, ocena zdrowia psychicznego, jakość snu oraz wpływ na wyniki w nauce).

Zbiór jest kompletny i nie zawiera brakujących wartości.

2 Porządkowanie danych

2.1 Braki danych

W danych znajduje się 100 % kompletnych wartości.

2.2 Walidacja danych

  • czy wiek przyjmuje wartości od 16 - 25?
  • czy godziny przyjmują wartości 0 - 24?
  • czy wszystkie wartości liczbowe są większe od 0?
  • czy mental health score i addicted score przyjmują wartości 1 - 10?
  • płeć - kobieta lub mężczyzna?
  • poziom wykształcenia - szkoła średnia, studia I stopnia lub studia II stopnia
  • status związku - wolny, w związku, “to skomplikowane”
  • czy wpływa na wyniki akademickie - tak lub nie?
reguly <- validator(
Age >= 16 & Age <= 25,
Gender %in% c("Female", "Male"),
Academic_Level  %in% c("High School", "Undergraduate", "Graduate"),
Avg_Daily_Usage_Hours > 0 & Avg_Daily_Usage_Hours < 24,
Affects_Academic_Performance %in% c("Yes", "No"),
Sleep_Hours_Per_Night >= 0 & Sleep_Hours_Per_Night <= 24,
Mental_Health_Score >= 1 & Mental_Health_Score<=10,
Relationship_Status %in% c("In Relationship", "Single", "Complicated"),
Addicted_Score >= 1 & Addicted_Score <= 10
)
cf <- confront(dane, reguly, key="Student_ID")

barplot(cf)
## Warning: The 'barplot' method for confrontation objects is deprecated. Use
## 'plot' instead

3 Wizualizacja danych

3.1 Charakterystyka demograficzna badanej grupy studenckiej

3.1.1 Rozkład Płci i Poziomu Akademickiego

dane$Academic_Level <- factor(dane$Academic_Level, 
                            levels = c("High School", "Undergraduate", "Graduate"))
dane$Gender <- factor(dane$Gender,
                  levels = c("Male", "Female")
)

ggplot(dane, aes(x = Academic_Level, fill=Gender)) +
  geom_bar(position = "dodge") +
  labs(title = "Rozkład płci i poziomu akademickiego",
       x = "Poziom akademicki",
       y = "Liczba studentów") +
  theme_minimal()

Analiza struktury demograficznej wskazuje na równomierny rozkład płci (blisko 50/50), natomiast w podziale na poziom edukacji przeważają osoby na studiach I i II stopnia, stanowiąc łącznie ponad 96% próby.

3.1.2 Wiek badanych

ggplot(dane, aes(x = Age)) +
  geom_histogram(binwidth = 0.5, fill = "skyblue", color = "black") +
  labs(title = "Wiek badanych studentów",
       x = "Wiek",
       y = "Liczba studentów") +
  theme_minimal()

Większość badanych to osoby w wieku od 19 do 23 lat, co wskazuje na silną koncentrację danych wokół typowego wieku studenckiego. Średnia wieku w próbie wynosi około 21 lat.

3.2 Intensywność Używania Social Mediów

3.2.1 Średni czas użycia

ggplot(dane, aes(x = Avg_Daily_Usage_Hours)) +
  geom_histogram(binwidth = 1, fill = "#9f2042", color = "#6c0d27") +
  labs(title = "Średni czas użycia social mediów dziennie",
       x = "Średni czas użycia (h)",
       y = "Liczba studentów") +
  theme_minimal()

Większość studentów spędza w mediach społecznościowych od 4 do 6 godzin dziennie, przy czym średnia dla całej grupy wynosi blisko 5 godzin. Rozkład wskazuje, że znaczna część badanych deklaruje wysoką aktywność cyfrową, przekraczającą 4 godziny na dobę.

3.2.2 Najczęściej używane platformy

dane %>%
mutate(top_5 = fct_lump_n(Most_Used_Platform, n = 4, other_level = "Inne")) %>%
  ggplot(aes(x = top_5)) +
  geom_bar(fill = "#6c0d27") +
  labs(title = "Najczęściej używane platformy social media",
       x = "Platforma",
       y = "Liczba studentów") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

3.3 Wpływ social mediów na wyniki akademickie

wykres <- dane %>%
  count(Addicted_Score) %>%
  ggplot(aes( x = Addicted_Score, y=n)) +
  geom_point(color= "blue")+
  geom_line(color= "blue")+
  labs(title = "Poziom uzależnienia uczniów",
       x = "Poziom uzależnienia",
       y = "Liczba uczniów") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5)
  )
plotly:: ggplotly(wykres)

Największa liczba badanych koncentruje się na umiarkowanych i wyższych poziomach uzależnienia, co wskazuje na powszechność intensywnego korzystania z mediów społecznościowych w badanej grupie.

ggplot(dane, aes(x = Affects_Academic_Performance)) +
  geom_bar(fill = "#6c0d27", width= 0.5)+
  scale_x_discrete(
    labels = c(
      "Yes" = "Tak",
      "No"  = "Nie"
    )
  ) +
  labs(title = "Wpływ social mediów na wyniki akademickie",
       x = "Czy social media wpływają na wyniki akademickie?", 
       y = "Liczba studentów")+
         theme_minimal()+
   theme(
    plot.title = element_text(hjust = 0.5)
  )

Zdecydowana większość badanych zadeklarowała, że korzystanie z social mediów wpływa na ich osiągnięcia akademickie, podczas gdy mniejsza część respondentów nie dostrzega takiego wpływu. Uzyskane wyniki sugerują, że studenci w dużym stopniu są świadomi oddziaływania mediów społecznościowych na wyniki w nauce.

3.4 Social media a zdrowie psychiczne

ggplot(dane, aes(x= Avg_Daily_Usage_Hours, y = Mental_Health_Score))+
geom_smooth(method = "lm", se = F) +
 labs(
    title = "Zależność między uzależnieniem od social mediów a zdrowiem psychicznym",
    x = "Poziom uzależnienia",
    y = "Poziom zdrowia psychicznego"
  ) +
  theme_minimal()+
  theme(
    plot.title = element_text(hjust = 0.5)
  )
## `geom_smooth()` using formula = 'y ~ x'

Wykres przedstawia linię regresji liniowej obrazującą zależność pomiędzy poziomem uzależnienia od social mediów a zdrowiem psychicznym studentów. Wraz ze wzrostem poziomu uzależnienia obserwuje się spadek wyników zdrowia psychicznego.

3.5 Wpływ social mediów na relacje interpersonalne

ggplot(dane, aes(x = Avg_Daily_Usage_Hours, y = Conflicts_Over_Social_Media)) +
  geom_point(alpha = 0.5) +
  geom_smooth(method = "lm", col = "blue") +
  labs(title = "Korelacja czasu używania social mediów z liczbą konfliktów") +
  theme_light()
## `geom_smooth()` using formula = 'y ~ x'

Wykres przedstawia zależność pomiędzy przeciętną liczbą godzin używania social mediów a liczbą konfliktów spowodanych social mediami wraz z przeiwdywaną linią trendu. Przy wzroście średniego dziennego użytkowania social mediów zauważa się również wzrost liczby konfliktów w tym temacie.

4 Statystyki opisowe

4.1 Tendencja centralna dla zmiennej Addicted Score

platform boxplot histogram points1
Facebook
Instagram
KakaoTalk
LINE
LinkedIn
Snapchat
TikTok
Twitter
VKontakte
WeChat
WhatsApp
YouTube
raport <- list("Addicted Score" = 
                 list("Min"= ~ min(Addicted_Score), 
                      "Max"= ~ max(Addicted_Score), 
                      "Q1"= ~ quantile(Addicted_Score,0.25), 
                      "Mediana"= ~ round(median(Addicted_Score),2), 
                      "Q3"= ~ quantile(Addicted_Score,0.75), 
                      "Średnia"= ~ round(mean(Addicted_Score),2), 
                      "Odch. std."= ~ round(sd(Addicted_Score),2), 
                      "IQR"= ~ round(IQR(Addicted_Score),2), 
                      "Odch. ćwiartkowe"=~round(IQR(Addicted_Score)/2,2), 
                      "Odch. std. w %"=~round((sd(Addicted_Score)/mean(Addicted_Score)),2), "Odch. ćwiartkowe w %"=~round((IQR(Addicted_Score)/median(Addicted_Score)),2), "Skośność"=~round(skew(Addicted_Score),2), "Kurtoza"=~round(kurtosi(Addicted_Score),2) ))
tabela_gender <- dane %>%
  group_by(Gender) %>%
  summarise(
    Min = min(Addicted_Score),
    Q1 = quantile(Addicted_Score, 0.25),
    Mediana = median(Addicted_Score),
    Q3 = quantile(Addicted_Score, 0.75),
    Max = max(Addicted_Score),
    Średnia = mean(Addicted_Score),
    SD = sd(Addicted_Score),
    Skośność = psych::skew(Addicted_Score),
    Kurtoza = psych::kurtosi(Addicted_Score)
  )

kable(tabela_gender,
      digits = 2,
      caption = "Tabela 4.2. Statystyki opisowe Addicted_Score w podziale na płeć") %>%
  kable_paper("striped", full_width = FALSE)
Tabela 4.2. Statystyki opisowe Addicted_Score w podziale na płeć
Gender Min Q1 Mediana Q3 Max Średnia SD Skośność Kurtoza
Male 2 5 7 7 9 6.36 1.45 -0.45 -0.82
Female 3 5 7 8 9 6.52 1.71 -0.24 -1.05

library(ggstatsplot)

5 Wnioskowanie statystyczne

ggbetweenstats(dane, Gender, Addicted_Score)

ggbetweenstats(dane, Academic_Level , Addicted_Score)

anova <- aov(Mental_Health_Score ~ Most_Used_Platform, data=dane)

dane |> aov(Mental_Health_Score ~ Most_Used_Platform, data=_) |> tidy() |> kbl() |> kable_classic(full_width = FALSE, html_font=“Cambria”)

5.1 Czy istnieje zależność między poziomem edukacji a najczęściej używaną aplikacją?

ggpiestats(dane, Academic_Level, Most_Used_Platform, bf.message = FALSE)